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AF003927 3532 bp mRNA linear MAM 17-APR-2001 

Bos taurus D-glucuronyl C5 epimerase mRNA, complete cds . 

AF003927 

AF003927.2 GI:13654638 

Bos taurus (cow) 
Bos taurus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Cetartiodactyla; Ruminantia; Pecora; Bovoidea; 
Bovidae; Bovinae; Bos. 

1 (bases 1 to 3532) 

Li, J., Hagner-McWhirter, A. , Kjellen,L., Palgi,J., Jalkanen,M. and 
Lindahl, U . 

Biosynthesis of heparin/heparan sulfate. cDNA cloning and 
expression of D-glucuronyl C5-epimerase from bovine lung 
J. Biol. Chem, 272 (44), 28158-28163 (1997) 
98010666 

9346972 

2 (bases 1 to 3532) 
Li, J. -P. and Lindahl,U. 

Direct Submission 

Submitted ( 14-MAY-1997 ) Medical and Physiological Chemistry, 
Biomedical Center, Husargatan 3, Uppsala 751 23, Sweden 

3 (bases 1 to 3532) 

Li, J. -P., Gong,F., Darwish, K . E . I . , Jalkanen,M. and Lindahl,U. 
Direct Submission 

Submitted (26-FEB-2001) Medical Chemistry and Microbiology, 
Biomedical Center, Husargatan 3, Uppsala 751 23, Sweden 

Sequence update by submitter 

On Apr 17, 2001 this sequence version replaced gi:2465198. 
Location/Qualif iers 
1. .3532 

/organism="Bos taurus" 
/mol_type="mRNA" 
/db_xref="taxon:9913" 
/tissue_type="lung" 
1. .1854 

/function="heparin/heparan sulfate biosynthesis" 
/codon_start=l 

/product="D-glucuronyl C5 epimerase" 
/protein_id="AAB72083.2" 
/db_xref="GI : 13654639" 

/translation="MRCLAARVNYKTLIIICALFTLVTVLLWNKCSSDKAIQVPRHLS 
SGFRVDALEKKAAASESNNYVNHMAKQSEEAFPQEQQKAPPWGGFNNNGGGRVLGLK 
YEEIDCLINDEHTIKGRREGNEVFLPFTWVEKYFDVYGKWQYDGYDRFEFSHSYSKV 
YAQRAPYHPDGVFMSFEGYNVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGL 
SHYSKNLTEKPPHIEVYETAEDRDKNSKPNDWTVPKGCFMASVADKSRFTNVKQFIAP 
ETSEGVSLQLGNTKDFIISFDLKFLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFKE 
RDIYYGIGPRTSWSTVTRDLVTDLRKGVGLSNTKAVKPTRIMPKKWRLIAKGKGFLD 
NITISTTAHMAAFFAASDWLVRNQDEKGGWPIMVTRKLGEGFKSLEPGWYSAMAQGQA 
I ST LVRAYLLT KDH I FLNS ALRATAP YKFLS EQHGVKAVFMNKHDWYEEYPTT P S S FV 
LNGFMYSLIGLYDLKETAGEKLGKEARSLYERGMESLKTMVILPLYDTGSGTIYDLRHFM 
LGIAPNLARWDYHTTHINQLQLLSTIDESPIFKEFVKRWKSYLKGSRAKHN" 



ORIGIN 



Query Match 85.1%; 
Best Local Similarity 91.0%; 
Matches 168 8; Conservative 



Score 1577.2; 
Pred. No. 0; 
0; Mismatches 



DB 4; Length 3532; 

163; Indels 3; Gaps 



Qy 

Db 



1 ATGCGTTGTTTGGCAGCTCGGGTCAACTAT7\AGACTTTGATTATCATCTGTGCGCTATTC 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I II II III 

1 ATGCGTTGTTTGGCAGCTCGGGTCAACTATAAGACTCTGATTATCATCTGCGCACTCTTC 



1; 



60 



60 



Qy 61 ACTTTGGTCACAGTACTTTTGTGGAATAAGTGTTCCAGCGACAAAGC7\ATCCAGTTTCCT 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ACTTTGGTCACAGTACTTTTGTGGAATAAGTGTTCCAGTGACAAAGCGATCCAGGTTCCA 120 

'Qy 121 CGGCACTTGAGTAGTGGATTCAGAGTGGATGGATTAGAAAAAAGATCAGCAGCATCTGTU^ 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 121 CGGCACTTGAGTAGTGGCTTCAGAGTGGATGCCTTAGAAAAAAAAGCAGCAGCGTCTGAG 180 

Qy 181 AGTAACCACTATGCCAACCACATAGCCAAACAGCAGTCAGAAGAGGCATTTCCTCAGGAA 24 0 

I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 181 AGCAACAACTATGTGAACCACATGGCCA AGCAGTCTGAGGAGGCCTTCCCTCAGG/^ .237 

Qy 241 CAACAGAAGGCACCCCCTGTTGTTGGGGGCTTCAATAGCAACGGGGGAAGCAAGGTGTTA 300 

II I I I I I II I I II I M I I I II II I I I I I I I II II III I I I I II III I I I I I II 

Db 238 CAGCAGAAAGCGCCCCCTGTTGTTGGGGGCTTCAATAACAATGGGGGAGGCAGGGTGTTA 2 97 

Qy 301 GGGCTCAAATATGAAGAGATTGACTGTCTCATAAACGATGAGCACACCATTAAAGGGAGA 360 

. I II I II I I I II I II I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I 1 I I I I I 
Db 298 GGGCTCAAATATGAAGAAATTGACTGCCTCATAAATGATGAACACACAATTAAAGGGAGA 357 

Qy 361 CGAGAGGGGAATGAAGTTTTCCTTCCATTCACTTGGGTAGAGAAATACTTTGATGTTTAT 420 

I I I I I I I I I M I I I I I I II I I M I II I I II I I I I I I I I I M I I I I I I I I I I I I I 

Db 358 CGAGAGGGGAATGAAGTCTTTCTTCCATTCACCTGGGTAGAGAAATATTTTGACGTTTAC 417 

Qy 421 GGAAAAGTGGTCCAGTATGACGGCTATGATCGATTTGAATTCTCTCATAGCTATTCCAAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I M I I I I I I I I I I II M I I I 
Db 418 GGAAAGGTGGTTCAGTATGATGGCTATGATCGGTTTGAATTCTCTCATAGCTATTCCAAA 477 

Qy 481 GTCTATGCACAGAGATCACCTTATCACCCTGACGGTGTGTTTATGTCCTTTGAAGGCTAC 540 

I I I I I I I I I I II I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I M I I I I II I I I I 

Db 478 GTCTATGCACAGAGAGCCCCTTATCACCCTGATGGTGTGTTTATGTCCTTTGAAGGCTAC 537 

Qy 541 AATGTGGAAGTCCGAGACAGAGTCAAATGTATAAGTGGAGTTGAAGGTGTGCCATTATCT 600 

M II I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 538 AATGTGGAAGTCCGAGACAGAGTCAAGTGCATAAGTGGGGTTGAAGGTGTACCTTTATCT 597 

Qy 601 ACCCAGTGGGGGCCTCAAGGCTATTTCTACCCAATCCAGATTGCACAGTATGGGCTAAGT 660 

II I I I I I I I I II I M I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 598 ACACAGTGGGGACCTC7\AGGCTATTTCTACCCAATCCAGATTGCACAGTATGGGTTAAGT 657 

Qy 661 CATTACAGCAAGAATCTAACCGAGAAACCCCCTCACATAGAAGTATATGAAACAGCAGAA 720 

i I I I I I I I I I I I I I I I I I I II I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I 
Db 658 CACTACAGCAAGAATCTAACTGAAAAACCCCCTCATATAGAGGTATATGAAACAGCAGAA 717 

Qy 721 GACAGGGACAGAAACATCAGACCTAATGAATGGACTGTGCCCAAGGGGTGCTTCATGGCC 7 80 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I II I Mill 
Db 718 GACAGGGACAAAAACAGCAAGCCCAATGACTGGACTGTGCCCAAGGGCTGCTTTATGGCT 777 

Qy 781 AGTGTGGCAGACAAGTCTAGATCCACCAATGTTAAACAGTTTATTGCTCCAGAAACCAGT 84 0 

I II II II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 77 8 AGTGTGGCTGATAAGTCAAGATTCACCAATGTTAAACAGTTCATTGCTCCAGAAACCAGT 837 

Qy 841 GAAGGTGTGTCTTTGCAGCTGGGAAACACAAAAGACTTCATTATTTCATTTGACCTCAAG 9 00 

I I I I I I I I II Mill I I I I I I I I II I I II II II I I I I I I I I I I I I I I I I I I I I I 
Db 838 GT^GGTGTATCCTTGCAACTGGGGAACACAAAAGATTTTATTATTTCATTTGACCTCAAG 8 97 

Qy 901 CTTTTAACAAATGGGAGTGTGTCTGTGGTTCTGGAGACCACAG7\7\AAGAATCAGCTCTTC 960 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 898 TTCTTAACAAATGGAAGCGTGTCTGTGGTTCTGGAGACGACAGAAAAGAATCAGCTCTTC 957 

Qy 9 61 ACTGTGCATTATGTCTCATVACACCCAGCTGATTGCTTTCAGAGACAGGGACATATACTAC 102 0 

I I I II I I I II I I II I II I I II I I I II I I II I I I II I III II I I I i I I I I I I I 

Db 958 ACTGTACATTATGTCTCAAATACCCAGCTAATTGCTTTTAAAGAAAGAGACATATACTAT 1017 

Qy 1021 GGCATTGGGCCCAGAACTTCATGGAGTACAGTTACCAGAGACCTGGTCACTGACCTCAGG 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 

Db 1018 GGCATCGGGCCCAGAACATCATGGAGCACAGTTACCCGGGACCTGGTCACTGACCTCAGG 1077 



Qy 1081 AAAGGAGTGGGCCTTTCTAACACAAAAGCTGTCAAGCCAACCAAAATCATGCCCAAAAAG 114 0 

I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I III I I I II I I I III 
Db 1078 AAAGGAGTGGGTCTTTCCAACACAAAAGCTGTCAAGCCAACAAGAATAATGCCCAAGAAG 1137 

Qy 1141 GTGGTTAGGTTGATTGCAAAAGGGAAGGGATTCCTGGACAACATTACCATCTCAACCACA 1200 

I II I II I II II M M II I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1138 GTGGTTAGGTTGATTGCGAAAGGGAAGGGCTTCCTTGACAACATTACCATCTCTACCACA 1197 

Qy 1201 GCCCACATGGCTGCATTCTTTGCTGCAAGTGACTGGCTAGTGAGGAACCAGGATGAGAAA 1260 

I I I I I I I I I I I I II Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1198 GCCCACATGGCTGCCTTCTTCGCTGCCAGTGACTGGCTGGTGAGGAACCAGGATGAGAAA 1257 

Qy 1261 GGTGGCTGGCCT^TTATGGTGACCCGGAAGTTAGGGGAAGGGTTTAAATCTTTAGAACCA 1320 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I III 

Db 1258 GGCGGCTGGCCGATTATGGTGACCCGTAAGTTAGGGGAAGGCTTCT^GTCTTTAGAGCCA 1317 

Qy 1321 GGATGGTACTCTGCCATGGCACAAGGGCAAGCCATCTCTACCTTAGTCAGGGCCTATCTT 138 0 

II I I II I I I I I I I II I I I j I I I II I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 
Db 1318 GGGTGGTACTCCGCCATGGCCCAAGGGCAAGCCATTTCTACATTAGTCAGGGCCTATCTC 1377 

Qy 1381 CTAACGAAAGACTATGTATTCCTCAGTTCAGCTTTAAGGGCAACAGCCCCATACAAGTTT 1440 

I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I II I I I I I I I II I I I I II I I I 
Db 1378 TTAACAAAAGACCATATATTCCTCAATTCAGCTTTAAGGGCAACAGCCCCTTACAAGTTT 1437 

Qy 1441 CCGTCAGAGCAGCATGGAGTTAAAGCCGTGTTCATGAATAAACATGACTGGTATGAAGAA 1500 

I I I I I I I I I I I I I I I I I I I II II Mill I II I II I II II II I II II II I II II II 
Db 1438 CTGTCAGAGCAGCATGGAGTCAAGGCTGTGTTTATGAATAAACATGACTGGTATGAAGAA 1497 

Qy 1501 TATCCAACCACACCTAGCTCTTTTGTTTTAAATGGCTTTATGTATTCTTTAATTGGGCTG 1560 

I I I I II I I I II I I II M I I I II I M I I II I I I I II I I M I I I I II I I I I I I I I I II I II 

Db 149.8 TATCCAACTACACCTAGCTCTTTTGTTTTAAATGGCTTTATGTATTCTTTAATTGGGCTG 1557 

Qy 1561 TATGACCTT^AAAGAAACAGCAGGGGAGACACTTGGGAAAGAAGCAAGGTCCTTGTACGAG 1620 

II I I I I M II II I II I I I I I I II I I III I I II I I I I M I I I II I I I M I I III 

Db 1558 TATGACTTAAAAGAAACTGCAGGGGAAAAACTCGGGAAAGAAGCGAGGTCCTTGTATGAG 1617 

Qy 1621 CGCGGCATGGAATCTCTTAAAGCCATGCTGCCCTTGTATGATACTGGCTCCGGGACCATC 1680 

II I II II I I I M I I II M M I I M I I I I I I I II M II I I I II I I I II MUM 

Db 1618 CGTGGCATGGAATCCCTTAAAGCCATGCTCCCCTTGTACGACACTGGCTCAGGAACCATC 1677 

Qy 1681 TATGACCTCCGCCACTTCATGCTTGGCATTGCTCCCAACCTGGCCCGCTGGGACTATCAC 174 0 

I M I I I I I I I I I I I I I I I M I I I I I II II I I I I I I I I I I I II I II I I I I I II I I I I I I 

Db 167 8 TATGACCTCCGGCACTTCATGCTTGGCATTGCCCCCAACCTGGCCCGCTGGGACTATCAC 1737 

Qy 1741 ACCACCCACATTAACCAGCTGCAGCTGCTCAGCACCATCGATGAGTCCCC7y\TCTTCAAA 1800 

I I I I I I II I I I II II M I II I M I I I II I I I I I I I I I II I I II I I I I I I I I I I M . 
Db 1738 ACCACCCACATCAATCAACTGCAGCTGCTTAGCACCATTGATGAGTCCCCAATCTTCAAA 1797 

Qy 18 01 GAATTTGTCAAGAGGTGGAAAAGCTACCTTA7\AGGCAGTAGGGCAAAGCACAAC 1854 

I I I I 11 M I I M II I II I M I I I II I I I I I I I M I I I M I I I I II I I I I I I 
Db 1798 GAATTTGTCAAGAGGTGGAAGAGCTACCTTAAAGGCAGCCGGGCAAAGCACAAC 1851 



Title: 



US-10-005-647-2 



RESULT 6 

AAW79263 

ID AAW79263 standard; protein; 444 AA. 

XX 

AC AAW7 9263; 
XX 

DT 15-FEB-1999 (first entry) 
XX 

DE Bovine glucuronyl CS-epimerase . 

XX 

KW Glucuronyl CS-epimerase; cattle; D-glucuronic acid; L-iduronic acid; 

KW heparin; heparan sulphate. 

XX 

OS Bos taurus . 

XX 

FH Key Location/Qualif iers 

FT Region 25. .45 

FT /note= "potential transmembrane region" 

FT Modif ied-site 51 

FT /note= "N-glycosylated" 

FT Modif ied-site 130 

FT /note= "N-glycosylated" 

FT Modified-site 220 

FT /note= "N-glycosylated" 

XX 

PN WO9848006-A1. 
XX 

PD 29-OCT-1998. 
XX 

PF 17-APR-1998; 98WO-SE000703 . 

XX . 

PR 18-APR-1997; 97SE-00001454 . 
XX 

PA (LIND/) LINDAHL U. 

PA (LIJJ/) LI J. 

XX 

PI Lindahl Li J; 

XX 

DR WPI; 1998-583655/49. 

DR N-PSDB; AAV62688. 
XX 

PT DNA sequence coding for mammalian glucuronyl C5-epimerase and functional 

PT derivatives - capable of converting D-glucuronic acid to L-iduronic acid 

PT in the synthesis of heparin and heparan sulphate. 
XX 

PS Disclosure; Page 18-19; 26pp; English. 
XX 

CC This is the amino acid sequence of bovine glucuronyl C5-epimerase . It was 

GO deduced from the sequence (see AAV62688) of a cDNA clone obtained from a 

CC bovine lung cDNA library. Glucuronyl C5-epimerase catalyses the 

CC conversion of D-glucoronic acid (GlcA) to L-iduronic acid (IdoA) . The 

CC invention relates to isolated or recombinant DNA sequences for a 

CC mammalian (including human) glucuronyl C5-epimerase or its functional 

CC derivative. Recombinant expression vectors and transformed host cells are 

CC also claimed. The nucleic acid and vector can be used for the recombinant 

CC production of the enzyme. Glucuronyl C5-epimerase is useful for 

CC converting GlcA to IdoA in the biosynthesis of heparin and heparan 

CC sulphate 

XX 

SQ Sequence 444 AA; 

Query Match 69.6%; Score 2271; DB 2; Length 444; 

Best Local Similarity 96.8%; Fred. No. 1.3e-203; 

Matches 430; Conservative 9; Mismatches 5; Indels 0; Gaps 0; 



Qy 175 MSFEGYNVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIE 234 

I I I I I I I I M I I I I I I I I I I I I I I I I I I N M I I I I M I I I I M I I I I I I I I I I I I I I I I 

Db 1 MSFEGYNVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIE 60 

Qy 235 VYETAEDRDRNIRPNEWTVPKGCFMASVADKSRSTNVKQFIAPETSEGVSLQLGNTKDFI 294 

111111111:1 : I I : I I I I I I I I I M I I I I I I I I I M I I I I I I I I I M I M I I I I I I I 
Db 61 VYETAEDRDKNSKPNDWTVPKGCFMASVADKSRFTNVKQFIAPETSEGVSLQLGNTKDFI 120 

Qy 295 ISFDLKLLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFRDRDIYYGIGPRTSWSTVTRD 354 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ' 121 ISFDLKFLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFKERDIYYGIGPRTSWSTVTRD 180 

Qy 355 LVTDLRKGVGLSNTKAVKPTKIMPKKWRLIAKGKGFLDNITISTTAHMAAFFAASDWLV 414 

I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 181 LVTDLRKGVGLSNTKAVKPTRIMPKKWRLIAKGKGFLDNITISTTAHMAAFFAASDWLV 240 

Qy 415 RNQDEKGGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDYVFLSSALRA 474 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I :: I I : I I I I I 
Db 241 RNQDEKGGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDHIFLNSALRA 300 

Qy 475 TAPYKFPSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGETLGKE 534 

I I I I I I I I I I I I { I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 
Db 301 TAPYKFLSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGEKLGKE 360 

Qy 535 ARSLYERGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTID 594 

M M M M M M M M M M M M M M M M M M M M M M M I M M M M M M I 
Db 361 ARSLYERGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTID 420 

Qy • 595 ESPIFKEFVKRWKSYLKGSRAKHN 618 

M M M I M M M M M M M M I 
Db 421 ESPIFKEFVKRWKSYLKGSRAKHN 444 



RESULT 15 
US-09-403-269-13 

; Sequence 13, Application US/09403269 

; GENERAL INFORMATION: 

; APPLICANT: ULF, Lindahl 

; APPLICANT: LI, Jin-Ping 

; TITLE OF INVENTION: DNA Sequence Coding for a Mammalian Glucuronyl C5-Epimerase and a 
; TITLE OF INVENTION: Process for Its Production 
; FILE REFERENCE: 003300-589 

; CURRENT APPLICATION NUMBER: US/09/403,269 

; CURRENT FILING DATE: 1999-10-18 

; PRIOR APPLICATION NUMBER: SE 9701454-2 

; PRIOR FILING DATE: 1997-04-18 

; PRIOR APPLICATION NUMBER: PCT/SE98/00703 

; PRIOR FILING DATE: 1998-04-17 

; NUMBER OF SEQ ID NOS : 13 

; SOFTWARE: PatentIn version 3.0 

; SEQ ID NO 13 

; LENGTH: 444 

TYPE: PRT 

0RG7\NISM: Human 
US-09-403-269-13 

Query Match 69.6%; Score 2271; DB 18; Length 444; 

Best Local Similarity 96.8%; Pred. No. 3e-220; 

Matches 430; Conservative 9; Mismatches 5; Indels 0; Gaps 0; 
Qy 175 MSFEGYNVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIE 234 

M M M M M M M M M M M M M M M M M M M M M M M M M M M M M M 
Db 1 MSFEGYNVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIE 60 



Qy 235 
Db . 61 



294 
120 



Qy 295 ISFDLKLLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFRDRDIYYGIGPRTSWSTVTRD 354 

I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I :: I I I I I I I I I I M I I I I I I I 
Db 121 ISFDLKFLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFKERDIYYGIGPRTSWSTVTRD 180 

Qy 355 LVTDLRKGVGLSNTKAVKPTKIMPKKWRLIAKGKGFLDNITISTTAHMAAFFAASDWLV 414 

I I I I I I I I I I I I I I I I I I I I : I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 LVTDLRKGVGLSNTKAVKPTRIMPKKWRLIAKGKGFLDNITISTTAHMAAFFAASDWLV 240 

Qy 415 RNQDEKGGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDYVFLSSALRA 474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I :: I I : I I I I I 
Db 241 RNQDEKGGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDHIFLNSALRA 300 

Qy 475 TAPYKFPSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGETLGKE 534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I M I I I I I I I I I I I I I I I I I I I I I I 
Db 301 TAPYKFLSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGEKLGKE 360 

Qy 535 ARSLYERGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTID 594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I I I I I I I I I I I I 
Db 361 ARSLYERGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTID 420 

Qy 595 ESPIFKEFVKRWKSYLKGSRAKHN 618 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 ESPIFKEFVKRWKSYLKGSRAKHN 444 



RESULT 1 
GLCEMOUSE 

ID GLCE MOUSE STANDARD; PRT; 618 AA. 

AC Q9EPS3; Q99MM0; 

DT 28-FEB-2003 (Rel. 41, Created) 

DT 28-FEB-2003 (Rel. 41, Last sequence update) 

DT lO-OCT-2003 (Rel. 42, Last annotation update) 

DE D-glucuronyl C5-epimerase (EC 5.1.3.-) (Heparin/heparan 

DE sulfate : glucuronic acid C5 epimerase) . 

GN GLCE. 

OS Mus musculus (Mouse) , 

OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

OC Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 

OX NCBI_TaxID=10090; 

RN [1] 

RP SEQUENCE FROM N.A. , TISSUE SPECIFICITY, AND FUNCTION. 

RC STRAIN=BALB/c; TISSUE=Liver , and Mast cells; 

RX MEDLINE-21282921; PubMed=1127 4 17 7 ; ' 

RA Li J. -P., Gong F., El Darwish K., Jalkanen M. , Lindahl U.; 

RT "Characterization of the D-glucuronyl C5-epimerase involved in the 

RT biosynthesis of heparin and heparan sulfate."; 

RL J. Biol. Chem. 276:20069-20077(2001). 

RN [2] 

RP SEQUENCE FROM N.A., AND SUBCELLULAR LOCATION. 

RC TISSUE=Mast cells; 

RX MEDLINE=21293046; PubMed-1127 9150 ; 

RA Crawford B.E., Olson S.K., Esko J.D., Pinhal M.A.S.; 

RT "Cloning, Golgi localization, and enzyme activity of the full-length 

RT heparin/heparan sulfate-glucuronic acid C5-epimerase . " ; 

RL J. Biol. Chem. 276:21538-21543(2001). 

CC -!- FUNCTION: Converts D-glucuronic acid residues adjacent to N- 

CC sulfate sugar residues to L-iduronic acids. 

CC PATHWAY: Heparin and heparan sulfate biosynthesis. 

CC -!- SUBCELLULAR LOCATION: Type II membrane protein. Golgi. 

CC -!- TISSUE SPECIFICITY: Widely expressed with highest levels in lung 

CC and lowest levels in spleen. 

CC -!- SIMILARITY: Belongs to the D-glucuronyl C5-epimerase family. 

CC 

CC This SWISS-PROT entry is copyright. It is produced through a collaboration 

CC between the Swiss Institute of Bioinf ormatics and the EMBL outstation - 

CC the European Bioinf ormatics Institute. There are no restrictions on its 



cc use by non-profit institutions as long as its content is in no way 

CC modified and this statement is not removed. Usage by and for commercial 

CC entities requires a license agreement (See http://www.isb-sib.ch/announce/ 

CC or send an email to license@isb-sib . ch) . 

CC — 

DR EMBL; AF325532; AAG42004.1; -. 

DR EMBL; AF330049; AAK26246.1; -. 

DR MGD; MGI:2136405; Glee. 

DR GO; GO: 0005794; C:Golgi apparatus; IDA. 

DR GO; GO: 0016857; F:racemase and epimerase activity, acting on . . .; IDA. 

DR GO; GO: 0015012; P:heparan sulfate proteoglycan biosynthesis; IDA. 

DR GO; GO: 0030210; P:heparin biosynthesis; IDA. 

KW Isomerase; Peptidoglycan synthesis; Golgi stack; Transmembrane; 

KW Signal-anchor. 



FT 


DOMAIN 


1 


11 


CYTOPLASMIC (POTENTIAL) . 


FT 


TRANSMEM 


12 


29 


SIGNAL -ANCHOR (TYPE-II MEMBRANE 


FT 








(POTENTIAL) . 


FT 


DOMAIN 


30 


618 


LUMENAL (POTENTIAL) . 


FT 


CONFLICT 


537 


537 


P -> S (IN REF. 2) . 


SQ 


SEQUENCE 


618 AA; 


70099 


MW; BF9445D9D7F5B9FA CRC64; 



Query Match 99.8%; Score 3256; DB 1; Length 618; 

Best Local Similarity 99.8%; Pred. No. 9.Be-235; 

Matches 617; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 MRCLAARVNYKTLIIICALFTLVTVLLWNKCSSDKAIQFPRHLSSGFRVDGLEKRSAASE 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MRCLAARVNYKTLIIICALFTLVTVLLWNKCSSDKAIQFPRHLSSGFRVDGLEKRSAASE 60 

Qy 61 SNHYANHIAKQQSEEAFPQEQQKAPPWGGFNSNGGSKVLGLKYEEIDCLINDEHTIKGR 120 

I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 SNHYANHIAKQQSEEAFPQEQQKAPPWGGFNSNGGSKVLGLKYEEIDCLINDEHTIKGR 120 

Qy 121 REGNEVFLPFTWVEKYFDVYGKWQYDGYDRFEFSHSYSKVYAQRSPYHPDGVFMSFEGY 180 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I IJ I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 REGNEVFLPFTWVEKYFDVYGKWQYDGYDRFEFSHSYSKVYAQRSPYHPDGVFMSFEGY 18 0 

Qy 181 NVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIEVYETAE 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 NVEVRDRVKCISGVEGVPLSTQWGPQGYFYPIQIAQYGLSHYSKNLTEKPPHIEVYETAE 240 

Qy 241 DRDRNIRPNEWTVPKGCFMASVADKSRSTNVKQFIAPETSEGVSLQLGNTKDFIISFDLK 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I -I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 DRDRNIRPNEWTVPKGCFMASVADKSRSTNVKQFIAPETSEGVSLQLGNTKDFIISFDLK 300 

Qy 301 LLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFRDRDIYYGIGPRTSWSTVTRDLVTDLR 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 301 LLTNGSVSWLETTEKNQLFTVHYVSNTQLIAFRDRDIYYGIGPRTSWSTVTRDLVTDLR 360 

Qy 361 KGVGLSNTKAVKPTKIMPKKWRLIAKGKGFLDNITISTTMM7\AFFAASDWLVRNQDEK 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 KGVGLSNTKAVKPTKIMPKKWRLIAKGKGFLDNITISTTAHMAAFFAASDWLVRNQDEK 420 

Qy 421 GGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDYVFLSSALRATAPYKF 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGWPIMVTRKLGEGFKSLEPGWYSAMAQGQAISTLVRAYLLTKDYVFLSSALRATAPYKF 480 

Qy 481 PSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGETLGKEARSLYE 540 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I i I I I I I I I I III 
Db 481 PSEQHGVKAVFMNKHDWYEEYPTTPSSFVLNGFMYSLIGLYDLKETAGETLGKEARPLYE 540 

Qy 541. RGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTIDESPIFK 600 

I I I I I I I I I I I I I I I I I II I I I II I II I I I I II I II I I I II I I I I I I I II M II II I I I I 
Db 541 RGMESLKAMLPLYDTGSGTIYDLRHFMLGIAPNLARWDYHTTHINQLQLLSTIDESPIFK 600 

Qy 601 EFVKRWKSYLKGSRAKHN 618 

I I I I I I I I I I I I I II I II 



' Db ' 601 EFVKRWKSYLKGSRAKHN 618 



